home *** CD-ROM | disk | FTP | other *** search
/ Language/OS - Multiplatform Resource Library / LANGUAGE OS.iso / icon / contrib / pcw.lha / chap1.let < prev    next >
Encoding:
Text File  |  1991-11-24  |  17.5 KB  |  374 lines

  1. .KF:chap1.toc
  2. .KW:59
  3. .XT:2
  4. .XB:0
  5. .X:10
  6. .L:59
  7. .M:1
  8. L---+----1----+----2----+----3----+----4----+----5T---+---R6----+----7----+----8
  9. .H:
  10. .H:
  11. .H:
  12. .F:
  13. .F:...$$$...
  14. .M:1
  15.  
  16.  
  17.  
  18.  
  19.                          CHAPTER 1
  20.                         
  21.                         INTRODUCTION
  22. .K:1.  INTRODUCTION
  23.  
  24.  
  25. .M:2
  26.        The purpose of this thesis is: (1) to examine a 
  27. variety of grammatical theories, and to discuss the 
  28. applicability of these theories to machine translation,
  29. (2) to discuss the structure and approach of a machine 
  30. translation program designed to translate a Biblical 
  31. passage into Spanish, and (3) to critique the results of 
  32. the machine translation of this Biblical passage. 
  33.  
  34. .H:
  35. .H:                                                             $$$
  36. .H:
  37. .F:
  38. .F:
  39.        The bulk of this introductory chapter will be 
  40. devoted to recounting the history of machine translation 
  41. from 1946 to the present.  The second chapter will discuss 
  42. the grammatical analysis of some selected clauses taken 
  43. from the Greek text of Matthew 26.  Five different analyses 
  44. will be done, and in each analysis a different theoretical 
  45. approach will be used.  The focus of each analysis will be 
  46. the relationships of words to each other within clauses.  
  47. For each of the theoretical approaches there will be a 
  48. discussion of the suitability of that approach for use in 
  49. machine translation. 
  50.  
  51. 2
  52.        The third chapter will focus on how sentences 
  53. relate to each other to form discourses.  The discussion 
  54. will be centered around a Semantic Structure Analysis of 
  55. the first half of Matthew 26.   This chapter will be of 
  56. particular importance because the machine translation 
  57. program developed in connection with this thesis relies 
  58. heavily on this type of analysis. 
  59.  
  60.        The fourth chapter will discuss the structure and 
  61. approach of the machine translation program itself.  The 
  62. complete source code for the program is listed in Appendix 
  63. G.  This chapter will also critique the translation of the 
  64. Biblical passage which was produced by the program.
  65.  
  66.  
  67.            A Brief History Of Machine Translation
  68. .K:       A Brief History Of Machine Translation
  69.                             
  70.        The material for this synopsis of the history of 
  71. machine translation comes primarily from three sources: 
  72. Hutchins (1982 & 1986:19-39), and Nagao (1986:17-48).  
  73. Studying these sources it can be seen that the dawn of 
  74. machine translation can be traced to the end of the
  75. Second World War when digital computers became generally 
  76. available.  In March of 1947 Warren Weaver, a member of the 
  77. Rockefeller Foundation, suggested that the same techniques 
  78. used to break codes during the war could be used to 
  79. 3
  80. translate languages as well.  Andrew D. Booth was consulted 
  81. on this matter, and he concluded that the computer could be 
  82. used as an automatic  dictionary provided it had enough 
  83. memory.   In 1949 Weaver circulated a memo entitled 
  84. Translation which suggested the possibility of translating 
  85. natural languages by computer.  This memo was the catalyst 
  86. which caused machine translation research to begin in 
  87. earnest. 
  88.  
  89.        Research on machine translation began at the 
  90. University of Washington in Seattle in 1949, at the 
  91. University of California in Los Angeles in 1950, at 
  92. Massachusetts Institute of Technology  in 1951,  at 
  93. Georgetown University in 1952, and Harvard University in 
  94. 1953.  In 1951 Yehoshua Bar-Hillel produced a survey 
  95. describing the state of machine translation as it stood at 
  96. the end of that year.  The paper raised a number of issues: 
  97. (1) the feasibility of doing completely automatic machine 
  98. translation, (2) the purpose of syntactic analysis, (3) the 
  99. use of statistical information, (4) the possibility of a 
  100. single grammatical model applicable to all languages, (5) 
  101. limited vocabularies, (6) post-editing, (7) the logical 
  102. basis of language, (8) a universal interlingua, and (9) 
  103. transfer grammars.  Bar-Hillel argued that due to the 
  104. difficulties of resolving semantic ambiguities, completely 
  105. automated highly accurate translations could not be 
  106. 4
  107. produced by machines at that time.  Bar-Hillel went on to 
  108. propose a semi-automatic translation process in which human 
  109. analysts would be involved in pre-editing and post-editing 
  110. the text. 
  111.  
  112.        In June of 1952 the Rockefeller Foundation sponsored 
  113. the first conference on machine translation  at  the 
  114. Massachusetts Institute of Technology.  At this conference 
  115. Stuart C. Dodd of the Washington Public Opinion Laboratory 
  116. presented his ideas for regularizing the morphology and 
  117. syntax of English.  Erwin Reifler of the University of 
  118. Washington proposed that writers be encouraged to write 
  119. with machine translation in mind.  Leon Dostert of the 
  120. Institute of Languages and Linguistics  at  Georgetown 
  121. University introduced the concept of using a pivot language 
  122. when translating into a multitude of languages.  Later, 
  123. Erwin Reifler suggested that English would best serve 
  124. as this pivot language.  Finally, Yehoshua Bar-Hillel 
  125. presented a completely new type of syntax which lent itself 
  126. to arithmetic and logical manipulations.  It could be said 
  127. that this conference produced the framework for machine 
  128. translation research for years to come. 
  129.  
  130.        After the 1952 conference a machine translation 
  131. project was set up at Georgetown University under Leon 
  132. Dostert in collaboration with IBM.  The goal was to produce 
  133. 5
  134. a small scale working model of a Russian-to-English 
  135. translating system.  The program was finished by the end of 
  136. 1953.  It required no pre-editing, and it went beyond word-
  137. for-word translation in that it did syntactic analysis of 
  138. its Russian input.  However, it was limited in that it had 
  139. a vocabulary of only 250 words, just six grammatical rules, 
  140. and worked on only select sentences.  The program was first 
  141. demonstrated on January 7, 1954, and the demonstration 
  142. received a good deal of publicity.  More demonstrations 
  143. were given throughout the year; one of which was to D. Y. 
  144. Panov of the USSR Academy of Sciences.  After Panov 
  145. returned to the USSR, research was begun on machine 
  146. translation in the Soviet Union. 
  147.  
  148.        Research into  machine  translation  began at 
  149. Cambridge, England in 1954 under Margaret Masterman.  Also 
  150. in this year the Massachusetts Institute of Technology 
  151. published the first issue of the journal Mechanical 
  152. Translation edited by Victor Yngve.  In 1955 news began to 
  153. come  out  of  the  Soviet Union about several machine 
  154. translation projects which were underway in Moscow and 
  155. Leningrad.  In the same year the Cambridge Language 
  156. Research Unit held its first meeting, a machine translation 
  157. institute was set up under the auspices of the Centre 
  158. Nationale  de  la  Recherche  Scientifique  at  Grenoble 
  159. 6
  160. University in France, and the first machine translation 
  161. project of Italy was started by Silvio Ceccato in Milan. 
  162.  
  163.        Machine translation research also began in Japan in 
  164. 1955 at Kyushu University centered around Professors 
  165. Toshihiko Kurihara and Tsuneo Tamachi.  At this time 
  166. Professor Tamachi received a Science Research Grant from 
  167. the Ministry of Education to build a translation computer 
  168. called the KT-1.  It was intended to translate between 
  169. Japanese, English, and German.  It could be said that 1955 
  170. marked the beginning of a period of enthusiastic worldwide 
  171. machine translation research. 
  172.  
  173.        About this time the United States Government began 
  174. to provide grants for research on machine translation to 
  175. universities and research institutes throughout the 
  176. country.  By 1957, the year that Russia launched its 
  177. Sputnik satellite, an impressive amount of research had 
  178. been completed in the United States.  Sputnik was a 
  179. considerable shock to the American people, and because of 
  180. this it was considered essential that Russian-to-English 
  181. translation be automated as quickly as possible.  In the 
  182. meantime the Soviets were aggressively pursuing their own 
  183. machine translation programs, especially in the Soviet 
  184. Academy of Sciences, so that by 1960 more researchers in 
  185. 7
  186. the Soviet Union were engaged in machine translation 
  187. research than in the United States. 
  188.  
  189.        A second machine translation project was begun in 
  190. Japan in 1957 at the Electrotechnical Laboratory of the 
  191. Industrial Institute of the Ministry of International
  192. Trade and Industry.  This project was placed under the 
  193. supervision of Hiroshi Wada, and encompassed optical 
  194. character recognition as well as machine translation.  The 
  195. system, informally known as 'Yamato', was completed in 
  196. 1959.  Its capabilities were somewhat rudimentary, but it 
  197. was the first English-to-Japanese machine translation 
  198. program in the world. 
  199.  
  200.        Another significant event which occurred in 1957 was 
  201. the publication by Noam Chomsky of Syntactic Structures, 
  202. the first of his books on Transformational Grammar.  This 
  203. development was significant for two reasons.  First, 
  204. Chomsky's grammar was one of the first which lent itself to 
  205. manipulation by means of computers since transformations 
  206. were governed by rules which could be implemented as 
  207. computer programs.  Second, Chomsky's grammar posited a 
  208. 'deep structure' which represented the semantic component 
  209. of language.  Until this time researchers in the field of 
  210. machine translation had studiously avoided the issue of 
  211. 8
  212. semantics, preferring to limit their investigations to 
  213. surface structure. 
  214.  
  215.        In 1960  the Special Committee on Mechanical 
  216. Translation (part of the  Committee on Science  and 
  217. Astronautics) submitted to the US House of Representatives 
  218. a report entitled Research on Mechanical Translation.  It 
  219. gave a synopsis of the history of machine translation up to 
  220. that point as well as an analysis of the state of machine 
  221. translation in 1960.  Among its many conclusions and 
  222. recommendations was that translation is heavily dependent 
  223. on human understanding--a semantic issue.  
  224.  
  225.        The Japanese were the first to confront the semantic 
  226. issue head on.  This was necessitated by the fact that the 
  227. syntax of Japanese is radically different from that of the 
  228. European languages.  While researchers working with 
  229. European languages could produce acceptable machine 
  230. translations between those languages while confining their 
  231. analyses to surface structure, successful translations 
  232. between the European languages and Japanese could not be 
  233. produced in this manner.  In 1964 Makoto Nagao proposed a 
  234. "method for investigating the usefulness of 'meaning 
  235. tables' or 'semantic networks', which have been widely 
  236. employed ever since." (Nagao 1989:24)  Nagao showed that 
  237. 9
  238. through the use of semantic networks the relationships 
  239. between the nouns in a sentence could be established. 
  240. .H:
  241. .H:                                                            $$$
  242. .H:
  243.  
  244.        Another  significant  event  of 1960 was the 
  245. publication of Yehoshua Bar-Hillel's paper titled A 
  246. Demonstration of the Nonfeasibility of fully Automatic High 
  247. Quality Translation which stated emphatically that high 
  248. quality, fully automatic machine translation was impos
  249. sible.  Then in April of 1964 the US Academy of Sciences 
  250. formed the Automatic Language Processing Advisory Committee 
  251. (ALPAC).  The committee was commissioned to report on the 
  252. present state of affairs in machine translation, and to 
  253. give its prognosis for the future.  On August 20, 1965 the 
  254. committee published Language and Machines: Computers in 
  255. Translation and Linguistics, better known as the ALPAC 
  256. report.  The committee had concluded that machine trans
  257. lation was more costly than human translation, and produced 
  258. inferior results.  They saw no hope for improvement in the 
  259. near future.  The report was widely criticized as biased, 
  260. inaccurate, and misleading, but the damage was done.  Soon 
  261. after the report's publication funding for research in 
  262. machine translation all but dried up.  Researchers in the 
  263. field became objects of social stigma.  Research virtually 
  264. stopped.  As a consequence, much of what had been learned 
  265. in the previous ten years was simply lost. 
  266.  
  267. 10
  268.        The period following the ALPAC report through the 
  269. late 1970's could be called the Dark Ages of machine 
  270. translation.  However, not all machine translation efforts 
  271. came to a halt.  At the time of the ALPAC report there were 
  272. two working Russian-to-English machine translation systems 
  273. in existence.  One was IBM's Mark II system, and the other 
  274. was the Georgetown University system.  The Georgetown 
  275. system was moved in 1965 to the Rome Air Defense Center in 
  276. Rome, New York where it has been in continuous use for more 
  277. than two decades.  Another surviving project was the 
  278. TAUM/METEO English-to-French weather forecast translator.  
  279. This system was developed at the University of Montreal, 
  280. and is still in use today. 
  281.  
  282.        Peter Toma, one of the pioneers of the Georgetown 
  283. program, established a private company which developed its 
  284. own  machine  translation  system  which  imitated  the 
  285. Georgetown model.  Called SYSTRAN, it was completed in 
  286. 1969, and installed at Wright-Patterson Air Force Base in 
  287. Dayton, Ohio.  Originally another Russian-to-English 
  288. system, it was later expanded to include Arabic, Dutch, 
  289. French, German, Italian, Japanese, Portuguese, and Spanish.  
  290. Today SYSTRAN is used at approximately twenty organizations 
  291. in the US, Europe, and Japan (Homer 1987:387-388). 
  292.  
  293. 11
  294.        In 1970 Brigham Young University established its 
  295. Translation Sciences Institute with Eldon G. Lytle as its 
  296. leader.  The purpose of the Translation Sciences Institute 
  297. was to develop an interactive machine translation system 
  298. called ITS (Interactive Translation System).  ITS was to 
  299. work with English, Chinese, French, German, Portuguese, and 
  300. Spanish.  This system had two distinctives:  First, ITS was 
  301. developed using a totally new grammatical model called 
  302. junction grammar.  Second, ITS was intended only for trans
  303. lations of a single source text into multiple target 
  304. languages.  Because its accuracy was obtained by heavy 
  305. interaction with translators during the analysis of the 
  306. source text, the process was not efficient for translations 
  307. into a single language.  ITS was successfully completed, 
  308. but was abandoned in 1979 because it was thought to be too 
  309. elaborate.  Interactive analysis of the source text was 
  310. time consuming, and translators resented having to answer 
  311. the system's trivial questions (Hutchins 1986:299-301).  
  312.  
  313.        Another system which was developed during the so-
  314. called Dark Ages of machine translation was named LOGOS.  
  315. This system, developed during the 1970s, was used to 
  316. translate from English-to-Vietnamese during the Vietnam 
  317. War.  Little research was carried out in Europe during this 
  318. period except in Grenoble, France at the Automatic Trans
  319. lation Research Institute (CETA) in association with the 
  320. 12
  321. National Center for Scientific Research (CNRS).  Work 
  322. continues there on Russian-to-French and French-to-Russian 
  323. to this day.  More recently, the institute has also been 
  324. developing a French-to-Malayan translator. 
  325.  
  326.        The Language Research Center at the University of 
  327. Texas at Austin began developing its German-to-English 
  328. translation system, METAL, in 1970.  Despite a two year 
  329. funding gap in 1977 and 1978, the project has continued up 
  330. to the present with additional work going on in Dutch, 
  331. French, and Spanish (Bennett 1987:382).  All told, there 
  332. were thirteen new major machine translation projects 
  333. started during the difficult period between 1967 and 1975 
  334. (Hutchins: 1986:336-337). 
  335.  
  336.        More recently, in 1976 the European Economic 
  337. Community embarked on a machine translation project of 
  338. unprecedented proportions.  Originally intended to provide 
  339. for translation among the four official EEC languages 
  340. (Dutch, French, German, and Italian), it was later expanded 
  341. to include five more (Danish, English, Greek, Portuguese, 
  342. and Spanish).  This means that there are nine EEC languages 
  343. which must be translated to and from eight others, giving a 
  344. total of seventy-two language pairs to be translated.  The 
  345. researchers thought at first that the translation needs of 
  346. the EEC might be met by the SYSTRAN system, but they 
  347. 13
  348. abandoned this approach in 1978 to develop their own 
  349. machine translation system called EUROTRA (van Eynde and 
  350. ten Hacken 1989:5).  The project is currently in the 
  351. prototype stage (van Eynde and ten Hacken 1989:38). 
  352.  
  353.        The Japanese government began to officially promote 
  354. research in machine translation in 1982.  Between 1984 and 
  355. 1985 more than ten Japanese companies put machine trans
  356. lation systems on the market (Nagao 1989:43-45).  One 
  357. particularly interesting system is the mu machine trans
  358. lation project which began in 1982 and was completed in 
  359. 1986.  This Japanese-to-English system is noteworthy 
  360. because of its heavy reliance on semantic and pragmatic 
  361. information during analysis of the source language text 
  362. (Nagao 1987:262-277).  Researchers in Japan have also begun 
  363. work on an interpreting telephone system (Nagao 1989:3). 
  364.  
  365.        Current working MT systems in the United States 
  366. include the Automatic Language Processing System (ALPS) 
  367. which was derived from Brigham Young University's ITS 
  368. system, and a keen competitor the Weidner system of Weidner 
  369. Communications Corporation.  Both are machine-aided trans
  370. lation systems.  The ALPS system works with English, 
  371. French, German, Italian, and Spanish.  The Weidner system 
  372. includes  all  of  these  plus  Arabic,  Japanese,  and 
  373. Portuguese.
  374.